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广电 媒体 数据 治理 设计 与 架构 


摘 要 : 本 文通 过 梳理 融合 媒体 背景 下 广播 电视 台 开 展 数据 治理 工作 的 重要 意义 和 现状 ， 探 讨 了 开展 数据 治理 工作 的 目标 ， 
设计 出 一 套 适 合 广电 媒体 数据 治理 使 用 的 组 织 结构 、 制 度 规范 和 常规 流程 ， 并 介绍 了 技术 实现 的 架构 方案 。 
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数据 是 广电 媒体 的 重要 资产 ， 是 其 科学 决策 分 析 管 
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各 业务 系统 自行 管理 数据 ， 内 数据 质量 较 低 ， 业 务 
数据 的 含义 在 单位 的 各 个 部 门 间 存 在 不 一 致 的 解释 ， 从 


理 的 基础 。 近 些 年 ， 大 多 数 广播 电视 台 花 费 大 量 的 资金 
和 时 间 建 立 了 各 种 信息 化 系统 来 支撑 业务 发 展 。 这 些 信 
息 系 统 已 成 为 广电 媒体 技术 体系 中 极为 重要 的 组 成 部 分 ， 
广电 媒体 也 收获 了 信息 化 带 来 的 互联 互通 、 资 源 共享 的 
红利 。 同 时 ， 在 这 些 系统 的 海量 数据 中 还 存在 着 许多 有 
价值 的 信息 可 以 提炼 , 广电 媒体 如 何 将 数据 集成 在 一 起 ， 
并 把 数据 转换 为 信息 、 知 识 加 以 利用 ， 我 们 称 之 为 广电 
媒体 的 数据 治理 ， 这 已 成 为 提高 节目 制作 传播 水 平和 管 
理 能 力 的 重要 一 步 。 
1. 广电 媒体 数据 治理 现状 

随 着 广电 媒体 对 云 计算 、 大 数据 等 技术 的 认识 逐步 


而 造成 数据 无 法 进行 分 析 。 
1.2 技术 方面 


已 经 意识 到 数据 治理 工作 的 重要 性 ， 但 是 并 没有 将 
其 提 到 战略 高 度 ， 技 术 部 门 的 注意 力 重 点 仍然 是 业务 系 
统 建设 和 和 运 维 。 

现 有 分 析 功 能 多 为 相应 业务 系统 的 子 模块 ， 与 业务 
系统 耦合 性 较 强 ， 缺 乏 对 全 业务 分 析 的 支持 。 

各 个 业务 系统 产生 数据 量 大 且 种 类 多 ， 现 有 技术 不 
具备 大 规模 并 行 处 理 或 分 布 式 处 理 能 力 ， 在 分 析 能 力 上 
有 “瓶颈 ”。 

各 个 业务 系统 在 同一 类 核心 数据 的 定义 上 标准 不 统 


深入 ， 并 且 由 于 媒体 间 竞 争 加 剧 ， 自 身 对 智慧 化 生产 、 
精细 化 管理 的 要 求 也 越 来 越 高 ， 各 级 广电 媒体 对 数据 整 
合 和 治理 的 必要 性 和 重要 性 已 经 充分 认可 ， 也 更 需要 将 
各 信息 系统 中 蕴含 的 类 型 繁多 、 数 量 庞大 的 数据 内 容 进 
行 加 工 处 理 。 从 业务 和 技术 两 个 层面 分 析 ， 广电 媒体 在 
数据 治理 上 主要 面临 以 下 挑战 : 

1.1 业务 方面 : 

言 息 系统 的 分 析 能 力 仅 支 持 提供 简单 的 报表 ， 功 能 
单薄 ， 无 法 满足 复杂 的 分 析 和 需求 。 例 如 ， 无 法 分 析 媒 体 
资产 系统 存在 的 资源 ， 哪 些 内 容 众 比较 喜欢 ， 在 节目 制 
作 中 可 重复 使 用 。 

业务 分 析 多 集中 于 单一 系统 ， 领 导 层 无 法 从 全 局 角 
度 对 各 个 业务 线 进行 跨 业务 、 多 角度 、 多 层次 的 综合 分 析 。 
例如 ， 领 导 层 无 法 从 全 局 掌握 节目 制作 的 效率 、 耗 费 的 
资金 、 社 会 反响 等 信息 。 

数据 不 一 致 问题 较 严 重 ， 相 同业 务 数 据 在 不 同系 统 
中 存在 多 个 不 同 版 本 。 


， 数 据 质量 差 ， 无 法 直接 二 次 利用 。 

以 上 问题 影响 广电 媒体 业务 合理 的 、 可 持续 的 展开 ， 
阻碍 了 其 在 大 数据 时 代 的 前 进 , 是 迫切 需要 解决 的 问题 。 
2. 数据 治理 目标 

在 实际 工作 中 ,广电 媒体 数据 纷繁 复杂 ， 从 数据 来 
源 上 看 既 有 生产 办 公 系 统 ( 如 媒 资 .文稿 、 磁 带 库 等 系统 ) 
数据 ， 也 有 从 自 有 新 媒体 系统 ( 网 络 广播 电视 台 、IPTV 
平台 、 客 户 端 等 ) 通过 埋 码 和 日 志方 式 采集 的 用 户 行为 
数据 ， 还 包括 通过 网 络 爬 虫 抓 取 的 互联 网 数据 和 从 数据 
源 提供 商 采 购 的 网 络 数据 和 收视 数据 ; 从 存储 容量 上 看 
既 有 常年 变化 不 大 的 上 百 MB 数 万 行 的 人 力 资源 数据 ， 
也 有 每 年 增长 上 百 TB 几 十 亿 条 记录 的 机 项 盒 终 端 采 集 
数据 ， 从 数据 形式 上 看 既 有 结构 化 的 , 也 有 半 结 构 化 的 。 
根据 这 些 数据 的 特点 ， 数 据 治理 需 达 到 以 下 目标 : 
2.1 数据 标准 化 
制定 数据 规范 ， 使 数据 有 准确 的 定义 。 
数据 被 完整 记录 且 精 度 满足 业务 要 求 。 
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数据 的 成 本 和 价值 可 计算 。 

数据 有 合理 的 存储 周期 。 
2. 2 数据 存储 和 访问 规则 化 

形成 统一 内 容 和 用 户 的 数据 架构 。 

形成 统一 的 数据 存储 模型 。 

形成 多 渠道 的 数据 访问 路 径 。 

数据 易 访 问 且 有 安全 机 制 。 
2. 3 数据 责任 化 

数据 有 明确 的 责任 方 。 

数据 内 容 符合 质量 要 求 。 
3. 数据 治理 体系 

当前 ， 各 广电 媒体 信息 化 程度 不 同 ， 数 据 规模 和 数 
据 质量 的 不 同 , 决定 了 开展 数据 治理 的 步 又 也 会 不 一 致 ， 
图 1 是 笔者 构想 中 的 适用 于 大 多 数 广电 媒体 开展 数据 治 
理工 作 体系 框架 的 一 般 途 径 。 为 了 有 序 实施 数据 治理 ， 
应 采用 规划 先行 分 步 实施 的 原则 ， 首 先 ， 依 据 各 广电 媒 
体 自身 目标 和 规划 明确 战略 方向 ; 其次， 制定 适合 自身 
业务 特点 的 组 织 架构 、 制 度 规范 和 管理 流程 ; 最 后 ， 才 
是 选择 可 行 的 技术 工具 和 实现 方案 。 


B 标 ”规划 “ 哆 


组 织 ”制度 流程 《让 


数据 资产 管理 ”数据 质量 管理 。 1 
数据 处 理 与 调度 1 


1 数据 治理 体系 框架 


在 战略 层面 ， 数 据 治理 既 要 以 解决 实际 工作 中 数据 
不 可 知 、 不 可 用 、 不 可 控 和 弱 关 联 的 问题 为 目标 ， 也 要 
结合 当 云 计算 、 大 数据 、 人 工 智能 等 技术 快速 迭代 发 展 
和 媒体 融合 趋势 进行 全 局 性 规划 制定 。 

在 机 制 屋面， 数据 治理 工作 需要 通过 组 织 、 制 度 、 
流程 的 完善 和 梳理 加 以 落实 ,切实 加 强 机 制 建设 才能 
证 持续 提升 数据 治理 执行 效果 。 

在 实现 层面 ， 包 括 元 数据 管理 系统 、 数 据 质量 管 
理 系统 、 数 据 调 度 与 处 理 系 统 等 ， 通 过 信息 化 系统 的 
建设 ， 将 纸 面 上 的 规划 、 制 度 和 流程 内 化 于 技术 平台 
和 工具 中 ， 用 于 辅助 管理 人 员 开 发 和 维护 ， 提 升 数据 
治理 工作 的 效率 。 

4. 数据 治理 机 制 
4.1 成 立 数据 治理 组 织 
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健全 的 组 织 架 构 是 开展 数据 治理 工作 的 基础 ， 可 有 
效 保障 数据 治理 工作 在 跨 部 门 间 的 高 效 推进 ,组织 中 人 
员 构 成 应 包括 管理 、 业 务 和 技术 三 种 类 型 ， 对 应 领导 组 、 
业务 组 、 技 术 组 三 种 角色 。 

领导 组 : 由 台 领 导 、 技 术 和 业务 部 门 负责 人 组 成 ， 
负责 建立 数据 治理 文化 ， 制 定数 据 治理 的 目标 、 规 划 、 
制度 、 流 程 等 ， 分 配 和 确保 数据 治理 工作 中 所 需要 的 资 
源 。 

业务 组 : 由 业务 骨干 、 业 务 部 门 系统 管理 员 组 成 ， 
负责 明确 数据 需求 , 维护 基础 数据 的 增 、 删 、 改 、 查 操作 ， 
在 数据 产生 源头 保障 数据 的 正确 性 和 实效 性 。 

技术 组 : 由 信息 化 部 门 的 相关 人 员 组 成 ,包括 开发 
人 员 、 数 据 库 管 理 员 、 系 统 运 维 人 员 。 系 统 开 发 人 员 负 
责 开 发 和 选用 适用 的 平台 和 工具 ; 数据 库 管理 员 负 责 数 
据 的 安全 、 备 份 和 审计 等 工作 ; 系统 运 维 人 员 负 责 检测 
数据 质量 和 系统 运 维 等 工作 。 
4. 2 规范 数据 治理 制度 

数据 治理 制度 应 作为 单位 强制 执行 规范 ， 制 度 需 阐 
明 数 据 治理 的 目的 、 适 用 范围 、 职 责 和 具体 内 容 ， 由 管 
理 办 法 、 技 术 规 范 和 实施 细则 等 部 分 组 成 。 数 据 治理 的 
制度 范围 应 包括 数据 标准 、 数 据 采 集 、 数 据 审核 、 数 据 
分 析 、 数 据 发 布 、 数 据 传输 、 数 据 存储 、 数 据 维护 、 数 
据 安 全 管理 、 数 据 质量 监控 、 数 据 管理 考核 等 在 数据 使 
用 过 程 中 的 方方面面 。 所 有 制度 的 制定 都 应 以 有 效 实用 
和 优化 服务 为 目标 ， 不 断 提 高 数据 的 规范 性 、 准 确 性 、 
完整 性 和 关联 性 。 规 章 制 度 最 终 可 落地 需要 有 一 套 行 之 
有 效 的 管控 办 法 ， 其 中 考核 是 是 保障 制度 落实 的 根本 ， 
需 建立 明确 的 考核 制度 ， 建 立 相 应 的 针对 数据 治理 方面 
的 考核 办 法 ， 定 期 加 以 考核 整改 。 
4. 3 完善 数据 治理 流程 

数据 治理 工作 的 主要 业务 流程 可 遵循 本 单位 数据 治 
理 的 规范 制度 和 数据 治理 的 内 容 分 为 发 现 、 定 义 、 应 用 、 
改进 四 个 核心 流程 阶段 。 其 中 发 现 流程 获取 已 有 数据 清 
单 、 数 据 当 前 的 状态 、 数 据 的 生命 周期 以 及 数据 当前 文 
持 维护 能 力 ; 定义 流程 记录 数据 的 定义 、 数 据 间 关 系 以 
及 实施 数据 治理 工作 必须 明确 的 规则 、 标 准 以 及 关键 性 
能 指标 ; 应 用 流程 是 执行 数据 治理 的 过 程 ， 涵 盖 了 数据 
的 交换 、 存 储 、 分 析 、 处 理 等 手段 ， 以 确保 数据 治理 与 
发 现 和 定义 流程 阶段 获取 的 所 有 业务 规则 、 工 作 流 程 、 
职能 角色 及 职责 相符 ;改进 流程 通过 数据 质量 管理 和 安 
全 保障 等 手段 用 于 推动 数据 治理 工作 的 有 效 性 及 价值 ， 
监测 是 否 与 定义 的 规则 和 标准 相符 。 


油 


202310.01657V1 


chinaXiv 


改进 发 现 

。 数据 质量 管理 。 已 有 数据 清单 
。 数据 安全 保障 。 数据 当前 状态 
。 价值 衡量 。 数据 生命 周期 


。 数据 维护 能 力 


数据 治 


理 流程 


应 用 定义 

。 数据 交换 。 数据 模型 定义 
。 数 据 存储 。 数 据 间 关 系 

。 数 所 分 析 应 用 。 关 键 性 能 指标 
。 数据 处 理 。 数 据 规则 、 标 准 


图 2 数据 治理 工作 流程 图 

5. 实现 体系 设计 

数据 治理 所 涉及 的 工具 和 平台 是 与 广电 媒体 整体 的 
数据 架构 体系 密 不 可 分 的 ， 图 3 给 出 了 一 套 面向 融合 业务 
环境 下 的 广电 媒体 数据 框架 图 ， 其 中 数据 治理 主要 通过 数 
据 管 理 平台 来 实现 ， 该 平台 贯穿 数据 业务 始终 。 包 括 数据 
资产 管理 系统 .数据 质量 管理 系统 和 数据 调度 处 理 系统 等 ， 
它们 是 数据 治理 能 够 顺利 开展 的 技术 保障 。 只 有 建立 功能 
齐备 的 数据 治理 工具 和 平台 ， 才 能 从 各 个 领域 有 效 地 进行 
数据 的 管理 和 治理 ， 提 高 广电 媒体 的 数据 价值 。 

数据 资产 管理 系统 : 统一 管理 全 媒体 的 数据 资产 ， 
包括 元 数据 、 数 据 标准 与 数据 模型 等 重要 的 数据 内 容 ， 
涵盖 数据 生命 周期 管理 功能 ， 并 提供 可 视 化 的 数据 查询 
和 展示 功能 ， 实 现 数据 资产 的 快速 与 便捷 查询 。 

数据 质量 管理 系统 : 落实 数据 质量 检测 工作 ， 实 现 
数据 质量 问题 的 发 现 、 跟 踪 、 治 理 、 评 价 的 全 流程 闭环 
管理 ， 包 括 数据 质量 规则 管理 、 数 据 采集 核验 、 数 据 质 
量 问题 发 现 、 数 据 质量 问题 分 析 等 模块 。 

数据 调度 与 处 理 系统 : 用 于 实现 各 系统 间 的 互联 互 


数据 存储 


数据 调度 与 处 理 系统 


图 3 广电 媒体 数据 框架 图 


数据 质量 管理 系统 
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通 ， 相 互 协同 与 验证 ， 为 数据 平台 和 业务 应 用 提供 数据 统 
一 、 形 式 多 样 的 数据 服务 。 在 该 系统 中 ， 还 需要 加 强 数 据 
使 用 中 访问 权限 的 安全 性 ,保障 数据 不 被 泄露 和 非法 访问 。 
总 结 

广电 媒体 的 数据 治理 是 一 个 持续 迭代 的 复杂 的 系统 
工程 。 对 技术 部 门 来 说 ， 需 从 战略 层面 出 发 ,认识 到 数据 
资产 的 重要 性 和 数据 治理 工作 对 未 来 发 展 的 巨大 价值 。 通 
过 数据 治理 进而 提供 数据 服务 ， 可 以 将 技术 管理 变 为 技术 
服务 ; 通过 数据 治理 进而 变现 数据 价值 ， 可 以 从 成 本 中 心 
转变 为 利润 中 心 。 同 时 ， 数 据 治理 过 程 涉及 业务 的 方 方 面 
面 ， 不 仅 是 对 数据 价值 充分 梳理 和 挖掘 的 过 程 ， 也 是 内 部 
管理 职能 优化 和 执行 力 强化 的 过 程 ,还 是 提升 核心 范 争 力 、 
在 现 有 业务 系统 基础 上 酝酿 跨 界 融合 创新 应 用 的 契机 。 为 
此 ,需要 在 治理 前 期 就 应 该 规划 好 各 项 规章 制度 和 管理 架 
构 ， 切 实 建 立 一 套 可 管 可 用 的 数据 治理 技术 平台 ,确保 后 
续 的 各 项 治理 工作 能 够 行 之 有 效 并 且 长 期 坚持 。 辕 
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